import requests
import re
# 爬虫打开的浏览器的网页
url = 'https://item.jd.com/100107613744.html#none'
resp = requests.get(url)  # 对象
# 设置编码格式
resp.encoding = 'utf-8'
print(resp.text)  # 对象名.属性名

# 从html中提取数据
'''
<p class="comment-con">
你好 Pura<br>开售第一时间抢到，真是幸运！p30pro的钉子户，终于换上新手机啦！
pura 70 pro+银色真的比网图好看很多，正常光线下更接近白色，但是又有低调闪光，
科技感十足。拍摄功能更不用说，闪拍功能真是妈妈救星，再也不会拍不清楚跑动的娃了！
微距也是拍植物必备，总有意想不到的效果
~</p>
'''
city = re.findall('<span class="name">([\u4e00-\u9fff]*)</span>',resp.text)
print(city)

weather = re.findall('<span class="weather">([\u4e00-\u9fff]*)</span>',resp.text)
print(weather)

wd = re.findall('<span class="wd">(.*)</span>',resp.text)
print(wd)

zs = re.findall('<span class="zs">([\u4e00-\u9fff]*)</span>',resp.text)
print(zs)

# 将提取出来的数据进行打包
lst = []
for a,b,c,d in zip(city,weather,wd,zs):
    lst.append([a,b,c,d])
print(lst)

for item in lst:
    print(item)

